Rôle de la matrice d'information et pondération des composantes dans les noyaux de Fisher pour PLSI

نویسندگان

  • Jean-Cédric Chappelier
  • Emmanuel Eckard
چکیده

RÉSUMÉ. Des similarités entre documents à base de catégories sémantiques latentes et de noyaux de Fisher ont été proposées pour la première fois il y a dix ans par T. Hofmann dans le contexte du “Probabilistic Latent Semantic Indexing”, puis étendues par Nyffenegger et al. (2006). Le présent article présente une étude approfondie et une révision de ces modèles par (1) une description unifiée et simplifiée, (2) une étude du rôle de la matrice d’information de Fisher G(θ), et (3) une analyse de l’impact des paramètres associés aux catégories latentes. Il fournit de plus de nouveaux résultats expérimentaux sur une grande collection de document provenant du corpus d’évaluation TREC–AP.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

Inspiration nihiliste dans La Chouette aveugle de Sadegh Hedayat

La Chouette aveugle de Sadegh Hedayat, auteur iranien, qui appartient à la catégorie des œuvres dites « noires », se fonde sur une inspiration nihiliste. Malgré l’influence indéniable de la philosophie nihiliste dans la création de cette œuvre compliquée, il n’y a aucune étude cohérente qui traite ce sujet de différents points de vue. Ce qui est certain, c’est que Hedayat était un lecteur atten...

متن کامل

Compression d'images par SVD et sur-approximation des composantes de chrominance

RÉSUMÉ. Dans cet article, nous présentons un nouveau schéma de compression d’image en couleurs qui effectue une approximation de la matrice des valeurs singulières. L’image doit être convertie dans l’espace luminance / chrominance avant d’être traitée comme dans le cas de la norme JPEG 4 : 2 : 0. Notre algorithme repose sur un sous-échantillonnage de la chrominance, puis une sur-approximation d...

متن کامل

ثبت اختراعات دارویی و بررسی چالش های حقوقی آن

La protection des produits pharmaceutiques par le droit des brevets est aujourd’hui un sujet brûlant, notamment en raison du progrès spectaculaire que connaît depuis quelques années le domaine de la biotechnologie. En générale, les brevets pharmaceutiques sont nécessaires pour stimuler la recherche de nouveaux médicaments plus efficace...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009